算法描述

自底向上的层次聚类算法

  • 先把数据集中的每个样本看成一个聚类簇
    • 然后在算法运行的每一步中找到两个距离最近聚类簇进行合并
    • 重复,直到达到预设的的聚类簇个数(有点像HUFFMANTREE的构建过程)

如何计算簇之间的距离?(集合之间的距离)

  • 一般有三种计算方法 Pasted image 20240602095518.png

  • 最小距离由两个簇最近样本决定

  • 最大距离由两个簇最远样本决定

  • 平均距离由两个簇所有样本共同决定

算法伪代码

Pasted image 20240602095736.png